17
1 резюме · 1 всего
День канала Pythonlibr — один пост: книжный анонс по обучению с подкреплением. Рекомендация книги, покрывающей алгоритмы обучения с подкреплением на Python: основы RL и его инструментарий, сочетание Q-обучения с нейросетями, методы градиента стратегии (TRPO, PPO), детерминированные алгоритмы (DDPG, TD3), imitation learning, исследование на базе вер…